“刷微博”不等于“刷寂寞”!论文推荐--基于社交媒体的突发事件应急信息挖掘与分析
随着微博、微信等新兴社交媒体的出现,越来越多的人习惯通过这些社交媒体获取信息。与此同时,“哥刷的不是微博,是寂寞”等言论层出不穷,有人愤而指出,微博都是垃圾信息,应当卸载微博,专心学术。
然而,微博作为目前热门的社交媒体,具有“自发性、及时性、广泛参与性、内容多样性”等特点,恰恰能弥补传统突发事件应急信息的不足。
武汉大学测绘遥感信息国家重点实验室王艳东教授等对此做了大量研究,基于社交媒体建立了实时应急主题分类模型,、快速提取、定位应急信息;探寻突发事件的时间趋势和空间分布,为应急响应提供决策支持;并撰写了《基于社交媒体的突发事件应急信息挖掘与分析》的论文,发表于《武汉大学学报·信息科学版》2016年第3期。点击最下方“阅读全文”即可在线阅读整篇论文。
文章内容ABSTRACT
该文主要研究了微博信息数据的实时获取与存储、应急信息实时分类模型的构建和基于应急信息的时空分析方法,并以“7-21北京特大暴雨”为例,具体阐述了利用社交媒体进行应急信息挖掘和分析的过程。
当突发事件发生时,可以通过微博开放平台API进行实时采集,也可以利用网页爬虫进行搜集。最后将获得的社交媒体数据存储在MongoDB中,供后续的分析使用。
最后,对应急信息进行实时定位,并在地图上标注。
突发事件以2012年“7.21”北京特大暴雨为例。实时收集了从7-20~8-10以“北京暴雨”为关键词的706 835条微博进行分析,得到主题-单词矩阵。
对主题进行总结、归纳,最后总结出以下6个主题-单词矩阵。
接下来,根据数据进行时空分析。
主要包括趋势分析和空间分析。
微博数量随突发事件的推进会产生波动,通过分析这些变化,以发现突发事件的总体趋势。
“天气报道”、“灾情信息”、“损失影响”三个主题分别对应暴雨事件的前期、中期和末期。
分析微博的主题,有助于进一步从不同的角度分析事件的发展。
各主题下微博在空间上有着明显的分布模式。
较大区域内散乱的点不利于发现突发事件的空间模式,可以对微博点进行聚类分析。聚类分析的算法如下。
聚类分析的结果如下。
引用本文: |
王艳东, 李昊, 王腾, 朱建奇. 基于社交媒体的突发事件应急信息挖掘与分析[J]. 武汉大学学报·信息科学版, 2016, 41(3): 290-297. WANG Yandong, LI Hao, WANG Teng, ZHU Jianqi. The Mining and Analysis of Emergency Information in Sudden Events Based on Social Media. GEOMATICS AND INFORMATION SCIENCE OF WUHAN UNIVERS, 2016, 41(3): 290-297. |
点击“阅读原文”可免费在线阅读本篇论文。